人体内的药物与靶标相互作用 (DTI) 在生物医学科学和应用中起着至关重要的作用。由于每年在生物医学领域都有数百万篇论文发表,从生物医学文献中自动发现 DTI 知识(通常由关于药物、靶标及其相互作用的三元组组成)成为业界的迫切需求。现有的发现生物知识的方法主要是提取方法,这些方法通常需要详细的注释(例如,所有生物实体的提及、每两个实体提及之间的关系等)。然而,由于需要生物医学领域的专家知识,因此获取足够的注释非常困难且成本高昂。为了克服这些困难,我们使用生成方法探索了此任务的第一个端到端解决方案。我们将 DTI 三元组视为一个序列,并使用基于 Transformer 的模型直接生成它们,而无需使用实体和关系的详细注释。此外,我们提出了一种半监督方法,该方法利用上述端到端模型来过滤未标记的文献并对其进行标记。实验结果表明,我们的方法在 DTI 发现方面的表现明显优于提取基线。我们还创建了一个数据集 KD-DTI 来推进这项任务,并将其发布给社区。
![arXiv:2109.13187v1 [cs.CL] 2021 年 9 月 27 日PDF文件第1页](/bimg/b/b09957b81f5f64c4ceb2031416674b78f66ab174.webp)
![arXiv:2109.13187v1 [cs.CL] 2021 年 9 月 27 日PDF文件第2页](/bimg/8/8af81f55b839c45011052c8fa796c42171876c17.webp)
![arXiv:2109.13187v1 [cs.CL] 2021 年 9 月 27 日PDF文件第3页](/bimg/6/6e3ff79a0f7e3f546ff93527759f08953a43b013.webp)
![arXiv:2109.13187v1 [cs.CL] 2021 年 9 月 27 日PDF文件第4页](/bimg/0/0a013398e768f3985464c4c555e6293c8d8639b5.webp)
![arXiv:2109.13187v1 [cs.CL] 2021 年 9 月 27 日PDF文件第5页](/bimg/b/b930b8e37fd43ad53fccf61c0303408f355a669c.webp)
